With the rising adoption of Machine Learning across the domains like banking, pharmaceutical, ed-tech, etc, it has become utmost important to adopt responsible AI methods to ensure models are not unfairly discriminating against any group. Given the lack of clean training data, generative adversarial techniques are preferred to generate synthetic data with several state-of-the-art architectures readily available across various domains from unstructured data such as text, images to structured datasets modelling fraud detection and many more. These techniques overcome several challenges such as class imbalance, limited training data, restricted access to data due to privacy issues. Existing work focusing on generating fair data either works for a certain GAN architecture or is very difficult to tune across the GANs. In this paper, we propose a pipeline to generate fairer synthetic data independent of the GAN architecture. The proposed paper utilizes a pre-processing algorithm to identify and remove bias inducing samples. In particular, we claim that while generating synthetic data most GANs amplify bias present in the training data but by removing these bias inducing samples, GANs essentially focuses more on real informative samples. Our experimental evaluation on two open-source datasets demonstrates how the proposed pipeline is generating fair data along with improved performance in some cases.
translated by 谷歌翻译
随着技术的快速提升,出现了迫切需要以最高的准确性和效率来微调或优化某些过程,软件,模型或结构。优化算法比通过实验或仿真的其他优化方法优选,因为它们的通用问题解决能力和最少的人类干预效果有望有望。近来,自然现象诱导算法设计已经极大地触发了优化过程的效率,即使是复杂的多维,不连续,非差异和嘈杂的问题搜索空间。本章介绍了基于群体智能(SI)的算法或群优化算法,这些算法是更大的受启发性优化算法(NIOAS)的子集。群体智能涉及对个人及其相互作用的集体研究,从而导致群体的智能行为。本章介绍了各种基于人群的SI算法,它们的基本结构以及其数学模型。
translated by 谷歌翻译
众所周知,传统平台之间的竞争可以通过将平台的操作与用户偏好保持一致,从而改善用户实用性。但是,在数据驱动的市场中表现出多大的一致性?为了从理论的角度研究这个问题,我们介绍了一个双重垄断市场,平台动作是强盗算法,两个平台竞争用户参与。该市场的一个显着特征是,建议的质量取决于强盗算法和用户交互提供的数据量。算法性能与用户的动作之间的这种相互依赖性使市场平衡的结构及其在用户公用事业方面的质量复杂化。我们的主要发现是,该市场的竞争并不能完全使市场成果与用户公用事业完全融合。有趣的是,市场成果不仅在平台拥有单独的数据存储库时,而且在平台具有共享数据存储库时表现不对。尽管如此,数据共享假设会影响什么机制驱动未对准的机制,并影响未对准的特定形式(例如,最佳案例和最差的市场成果的质量)。从更广泛的角度来看,我们的工作说明了数字市场中的竞争对用户实用性产生了微妙的后果,值得进一步调查。
translated by 谷歌翻译
人们最近开始通过社交网站上用户生成的多媒体材料来传达自己的思想和观点。此信息可以是图像,文本,视频或音频。近年来,这种模式的发生频率有所增加。 Twitter是最广泛使用的社交媒体网站之一,它也是最好的地点之一,可以使人们对与蒙基波疾病有关的事件有一种了解。这是因为Twitter上的推文被缩短并经常更新,这两者都促成了平台的角色。这项研究的基本目标是对人们对这种情况的存在的各种反应进行更深入的理解。这项研究重点是找出个人对猴蛋白酶疾病的看法,该疾病介绍了基于CNN和LSTM的混合技术。我们已经考虑了用户推文的所有三个可能的极性:正,负和中立。使用CNN和LSTM构建的架构来确定预测模型的准确性。推荐模型的准确性在Monkeypox Tweet数据集上为94%。其他性能指标(例如准确性,召回和F1得分)也用于测试我们的模型和最大程度和资源有效的方式。然后将发现与更传统的机器学习方法进行比较。这项研究的发现有助于提高对普通人群中蒙基托感染的认识。
translated by 谷歌翻译
数字推荐系统(例如Spotify和Netflix)不仅会影响消费者的行为,还会影响生产者的激励措施:生产商试图提供系统推荐的内容。但是将产生什么内容?在本文中,我们研究了内容推荐系统中的供应方均衡。我们将用户和内容建模为$ d $维矢量,并推荐与每个用户具有最高点产品的内容。我们模型的主要特征是生产者的决策空间高维,用户群是异质的。这引起了平衡的新定性现象:首先是流派的形成,生产者专门竞争用户的亚集。使用二元参数,我们得出了这种专业化的必要条件。其次,我们表明生产商可以在平衡下实现正利润,这在完美的竞争中通常是不可能的。我们得出了足够的条件,并证明它与内容的专业化密切相关。在这两种结果中,用户的几何形状与生产者成本的结构之间的相互作用都会影响供应方均衡的结构。从概念上讲,我们的工作是研究推荐系统如何塑造生产者之间供应方竞争的起点。
translated by 谷歌翻译
尽管U-NET体系结构已广泛用于分割医学图像,但我们解决了这项工作中的两个缺点。首先,当分割目标区域的形状和尺寸显着变化时,香草U-NET的精度会降低。即使U-NET已经具有在各种尺度上分析特征的能力,我们建议在U-NET编码器的每个卷积模块中明确添加多尺度特征图,以改善组织学图像的分割。其次,当监督学习的注释嘈杂或不完整时,U-NET模型的准确性也会受到影响。由于人类专家在非常精确,准确地识别和描述所有特定病理的所有实例的固有困难,因此可能发生这种情况。我们通过引入辅助信心图来应对这一挑战,该辅助信心图较少强调给定目标区域的边界。此外,我们利用深网的引导属性智能地解决了丢失的注释问题。在我们对乳腺癌淋巴结私有数据集的实验中,主要任务是分割生发中心和窦性组织细胞增多症,我们观察到了基于两个提出的增强的U-NET基线的显着改善。
translated by 谷歌翻译
在表演性预测中,预测模型的部署触发了数据分布的变化。由于这些转变通常是未知的,因此学习者需要部署模型以获取有关其引起的分布的反馈。我们研究了在性能下发现近乎最佳模型的问题,同时保持低廉的遗憾。从表面上看,这个问题似乎等同于强盗问题。但是,它表现出一种从根本上说的反馈结构,我们将其称为表演反馈:在每次部署后,学习者都会从转移的分布中收到样本,而不仅仅是关于奖励的强盗反馈。我们的主要贡献是一种算法,该算法仅随着分配的复杂性而不是奖励功能的复杂性而实现后悔的界限。该算法仅依赖于移位的平滑度,并且不假定凸度。此外,它的最终迭代保证是近乎最佳的。关键算法的想法是对分布变化的仔细探索,该分布变化为新颖的置信范围构造了未开发模型的风险。从更广泛的角度来看,我们的工作为从土匪文献中利用工具的概念方法建立了一种概念性方法,目的是通过表演性反馈最小化后悔的目的。
translated by 谷歌翻译
病理学涉及通过分析人体标本发现疾病的原因的做法。在该领域中最常用的方法,是使用组织学,其基本上是研究和观察细胞和组织中的微观结构。被广泛使用,并转换成数字形式的滑动观看方法来产生高分辨率图像。这使得深学习和机器学习深潜的面积为医学科学这个领域。在本研究中,一个基于神经网络已经提出了血细胞图像的分类成各种类别。当输入图像是通过所提出的架构通过和所有超参数和降比率值是按照提出的算法,那么模型进行分类的血液与图像的95.24%的准确度使用。提出的模型的性能比现有的标准体系结构及工作由不同的研究人员做的更好。因此,模型将使病理系统,这将减少对实验室男人人为错误和日常负荷的发展。反过来,这将帮助病理学家在更有效地开展工作。
translated by 谷歌翻译
癫痫是在4000年全球出现回来的最常见的神经系统疾病之一。这几天它会影响大约5000万人的人。这种疾病的特征是复发癫痫发作。在过去的几十年里,可用于癫痫发作控制的治疗方法已经提高了很多关于医学技术领域的进步。脑电图(EEG)是一种广泛使用的技术,用于监测大脑活动,广泛流行的癫痫发作区域检测。它在手术前进行,并且还在在神经刺激装置中可用的时间操作预测癫痫发作。但在大多数情况下,视觉检查是通过神经病学家进行的,以检测和分类疾病的模式,但这需要大量的域名知识和经验。这一切依次对神经外部产生压力,并导致时间浪费,并降低了他们的准确性和效率。需要一些在信息技术领域的自动化系统,例如在深度学习中使用神经网络,可以帮助神经根学家。在本文中,提出了一种模型,可提供98.33%的准确性,可用于开发自动化系统。发达的系统将显着帮助神经科学家的表现。
translated by 谷歌翻译
及时诊断对于拯救癫痫患者的寿命非常重要。在过去的几年里,癫痫有很多治疗方法。这些治疗需要使用抗癫痫药物,但在控制癫痫发作频率方面无效。需要使用手术去除受影响的区域。脑电图(EEG)是一种广泛使用的技术,用于监测大脑活动,广泛流行的癫痫发作区域检测。它在手术前使用,以定位受影响区域。使用EEG图表的手动过程是耗时,需要深入的专业知识。在本文中,已经提出了一种模型,其保留了文本一维向量的形式的EEG信号的真实性质。拟议的模型实现了Bonn大学数据集的艺术表现状态,分别为所有五类脑电图数据分类,分别为平均灵敏度,特异性为81%和81.4%。同样对于二进制分类,特异性和敏感性的99.9%,比分数为99.5%,而不是其他研究人员使用的2D模型。因此,开发系统将显着帮助神经外科,从而提高其性能。
translated by 谷歌翻译